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ABSTRACT 

RELATIONSHIP OF CLUSTERING METHODS BY CORRELATION OF COPHENETIC MATRI- 
CES. Clustering methods are used in order to evaluate their performances using the same data set. The variables 
are used in their original scale or trasformed by standardization and the similarity between pairs of OTU’s is 
estimated by correlation and taxonomic distance. The resulting similarity matrices are clustered by diferent 
methods. The resulting matrices of cophenetic values are correlated and these values rearranged in matricial 
form. These matrices are than clustered by UPGMA. The results showed the cases of better agreement between 
pairs of clustering methods according to the scale of the variables and to the measure of similarity between pairs 
of OTU’s. 
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INTRODUgAO 

Quando, para uma dada situagao experimental uma analise de agrupamento e 
indicada, toma-se necessario um procedimento que leve em conta a possibilidade de 
escalonamento de variaveis, a conseqiiente selegao do coeficiente de semelhanga e a 
adequagao do metodo de agrupamento. Nesta situagao, os dados experimentais sao 
dispostos em forma matricial do tipo D(n,t) onde n, numero de linhas, corresponde a 
atributos e t, numero de colunas, corresponde as OTU’s (Unidades Taxonomicas 
Operacionais), ou seja, elementos que se pretende agrupar. Ocorre que, freqiientemente, 
os resultados a partir de D(n,t) nao sao totalmente concordantes. Justifica-se pois um 
estudo sobre os resultados proporcionados por diferentes metodos de agrupamento, 
considerando-se ainda o escalonamento das n variaveis e a medida da semelhanga entre 
OTU’s. 

Neste projeto, a avaliagao dos resultados de agrupamento e feita com base em 
correlagao das matrizes de valores cofeneticos resultantes da aplicagao de diferentes 
metodos. A conceituagao de correlagao cofenetica e devida a SOKAL & ROHLF (1962), 
como medida da representatividade da matriz de semelhangas entre OTU’s pelo 
agrupamento correspondente. As tecnicas de agrupamento, em sua grande maioria, estao 
descritas em SNEATH & SOKAL (1973), ANDERBERG (1973) e DUNN & EVERITT 
(1982). 
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MATERIAL E METODOS 



Serviram de suporte ao desenvolvimento deste projeto dados morfometricos dzBombus atratus Franklin 
1913, utilizados por KERR & CUNHA ( 1 990) para a obten^ao de estruturas classificatorias, atraves de analises 
de agrupamento e de ordenagao. Este conjunto de dados e representado por n=43 variaveis quantitativas 
(caracteres), relacionadas em KERR (1987) e t=72 unidades taxonomicas (OTU’s), das quais 23 exemplares 
sao machos, 27 sao femeas e 22 sao rainhas da especie. 

Para a analise pretendida, as variaveis sao utilizadas em sua escala original ou transformadas por 
estandardiza^ao. A partir destas matrizes sao calculados os coeficientes de correlagao linear e de distancia 
taxonomica entre OTU’s. Estas matrizes de semelhangas (72 x 72) sao entao agrupadas por ligagao simples 
(SINGL ), ligagao completa ( COMPL ), pelo metodo ponderado ( WPGMA ) e nao ponderado ( UPGMA ) de 
agrupamento aos pares por medias aritmeticas e pelo metodo ponderado de agrupamento com o recurso das 
somas de Spearman ( WPGMS ), qiiando a semelhanga entre OTU’s e medida por correlagao linear. Para 
semelhanga entre OTU’s medida por distancia taxonomica, sao utilizados os metodos SINGL, COMPL, 
WPGMA, UPGMA e os metodos ponderado ( WPGMC ) e nao ponderado ( UPGMC ) de agrupamento pela 
media de centroides. Em cada caso, uma matriz de valores cofeneticos e obtida. Em seguida, todas as matrizes 
de valores cofeneticos sao correlacionadas e os resultados reunidos em forma matricial. Estas matrizes sao 
entao submetidas a agrupamento por UPGMA. 



RESULTADOS 

Do procedimento adotado, resultaram duas matrizes de correlagao entre OTU’s, 
sendo uma obtida a partir de variaveis em escala original e outra com as variaveis 
transformadas por estandardizagao. Estas matrizes foram submetidas a cinco metodos de 
agrupamento, quando a semelhanga entre OTU’s foi medida por correlagao e a seis 
metodos, quando foram estimadas distancias taxonomicas entre OTU’s. De cada aplicagao 
de um dos metodos de agrupamento resultou uma matriz de valores cofeneticos. 

As matrizes de valores cofeneticos foram entao correlacionadas, segundo o 
coeficiente de semelhanga utilizado; os resultados obtidos dispostos em forma matricial 
sao os constantes das tabelas I e II , nas quais um R ou um S acrescidos as siglas dos 
metodos de agrupamento indicam, respectivamente, variaveis em escala original e 
estandardizadas. Na seqiiencia , estas matrizes de correlagao (tab. I, II) foram agrupadas 
por UPGMA e os fenogramas ilustrativos das inter-relagoes dos diferentes metodos de 
agrupamento sao os da figuras 1 e 2. Em 1 o coeficiente de correlagao cofenetica e 
r = 0,90 e em 2 r = 0,67. 



Tabela I. Matriz de correlagao entre matrizes de valores cofeneticos dos diferentes metodos de agrupamento. 
Correlagao entre todos os exemplares. 
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DISCUSSAO 

E relativamente comum que, ao serem apresentados os resultados de uma analise 
de agrupamento, a ilustragao seja feita atraves de fenogramas, aos quais sao associados 
os coeficientes de correlagao cofenetica. Este coeficiente e interpretado como nivel de 
representatividade da matriz de semelhangas, pois e calculado entre os elementos desta 
matriz e os elementos da matriz resultante da aplicagao de um metodo de agrupamento 
(matrizes de valores cofeneticos). 

Resultados de uma analise de agrupamento podem, e freqiientemente ocorre, levar 
a diferentes grupos de OTU’s, dependendo da escala da variavel (carater); do numero 
deles que, se pequeno proporciona configuragoes instaveis, da medida de semelhanga 
entre OTU’s e do metodo de agrupamento utilizado. 

No caso presente, uma comparagao especifica entre cada par de metodos de 
agrupamento pode ser obtida consultando-se uma das tabelas, respeitadas as condigoes 
em que foram obtidas. Por outro lado, os fenogramas ilustram , alem dos casos de maior 
concordancia entre metodos, a estrutura de todo o conjunto. Nota-se que na fig.l estao 
representados dois grandes grupos de metodos, com semelhanga proxima de r = 0,60, 
reunindo, de um lado, resultados a partir de variaveis em escala original e, de outro, a 
partir de variaveis estandardizadas. Intemamente, os grupos de metodos se assemelham 
em tomo de r = 0,85. Na fig. 2 tais agrupamentos nao se revelam. Ainda com referenda 
as figs.l e 2, pelo menos dois outros aspectos merecem comentarios. Quanto ao mvel 
geral de semelhangas, o fenograma em 1 mostra maior homogeneidade do conjunto de 
metodos, o que pode tambem ser observado pelos resultados reunidos na tabela II. Ainda, 
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Figs. 1-2. Fenogramas (UPGMA) ilustrativos das inter-rela^oes de metodos de agrupamento por correla^ao 
de matrizes de valores cofeneticos. 1 ) Correla^ao entre OTU’s. Correlagao cofenetica r = 0,90. 2 ) Distancia 
taxonomica entre OTU’s. Correla^ao cofenetica r = 0,67. 
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Tabela II. Matriz de correla^ao entre matrizes de valores cofeneticos dos diferentes metodos de agrupamento. 
Distancia taxonomica entre todos os exemplares. 
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o coeficiente de correlagao cofenetica menor em 2, r = 0,67, pode ser visto como 
conseqiiencia de operagao entre grandezas proximas, que nao permitem encontrar grupos 
bem definidos, um dos objetivos da analise de agrupamento. 

Assim, se resultados de metodos de agrupamento devam ser comparados, mostram- 
se mais semelhantes COMPL e WPGMA para correlac^ao entre OTU’s, com as variaveis 
em escala original, e UPGMA WPGMA para correlasoes entre OTU’s, com as variaveis 
transformadas por estandardizagao (fig. 1). No mesmo sentido, mas utilizando-se de 
distancia taxonomica entre OTU’s, os resultados dos mais concordantes sao obtidos entre 
UPGMA e UPGMC, independentemente da escala das variaveis, o que ocorre tambem 
com os resultados da utiliza^ao do WPGMA ( fig. 2). 
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